rank | frequency | n-gram |
---|---|---|
1 | 20697 | -് |
2 | 17009 | -ം |
3 | 15062 | - |
4 | 10360 | -െ |
5 | 7338 | -ി |
rank | frequency | n-gram |
---|---|---|
1 | 15062 | -് |
2 | 10930 | -ും |
3 | 4278 | -ണ് |
4 | 3827 | -ന് |
5 | 3085 | -ടെ |
rank | frequency | n-gram |
---|---|---|
1 | 6963 | -ല് |
2 | 4257 | -ാണ് |
3 | 2977 | -ള് |
4 | 2869 | -ന് |
5 | 2708 | -യും |
rank | frequency | n-gram |
---|---|---|
1 | 5223 | -ില് |
2 | 2304 | -ന്ന് |
3 | 2298 | -ന്നു |
4 | 2252 | -ക്ക് |
5 | 2163 | -ന്റെ |
rank | frequency | n-gram |
---|---|---|
1 | 1962 | -ുന്നു |
2 | 1773 | -ിന്റെ |
3 | 1680 | -െന്ന് |
4 | 1254 | -യില് |
5 | 1043 | -തില് |
The tables show the most frequent letter-N-grams at the ending of words for N=1…5. Everything runs in parallel to 2.2.5 Most frequent word beginnings. The aim is suffix detection instead of affix detection.
For N=3:
SELECT @pos:=(@pos+1), xx.* from (SELECT @pos:=0) r, (select count(*) as cnt ,concat("-", right(word,3)) FROM words WHERE w_id>100 group by right(word,3) order by cnt desc) xx limit 5;
2.2.5 Most frequent word beginnings